“建立数据指标体系,监控业务走势并发现异常情况”是数据分析的一项基础工作要求,然而很多同学都遇到过,被领导或者业�?diss 数据监控做得不到位,发现问题不及时、不准确、不深入。BUT!并不是“谁闹谁有理”,很多时候业务的吐槽并没有道理,要具体分情况看�? # 一、数据监控是�? 举个简单的例子,开车的时候,开个导航,导航就是个数据监控产品。只要设定好终点,导航可以根据定位自动显示起点,然后一路上提醒你:
- 距离目标还有 XX 公里
- 当前路段限�?80,您已超�?- 前方拥堵,已为你推荐新路�? 瞧,多好用!
从这个小例子里,能看出来数据监控四要素:
1、监控目标(目的地) 2、当前情况(到达时间、速度�?3、业务行动(坐什么车,选哪个路�?4、预计判断(基于当前拥堵预判�? 而现实中,这四样东西很可能不存在,这就是所谓“无理取闹型 diss”�? 
二、无理取闹的 diss
无理取闹一:没有监控目标�?
喊着让监�?DAU,那么,DAU 每日目标是多少?丫自己都不知道!喊着让监控销售额,销售额每日目标是多少?丫也不知道!这就好像要开车了,打开导航大喊:“导航导航,你快分析出来我想去哪里!”亲,你需要的不是导航,是魔法扫除哈�? # 无理取闹二:标准来回变化�? 定了每日目标,但是丫觉得“你看,昨天超标 5% ,今天超�? 1% ,不行不行,肯定有问题!”还是回来吐槽。结果过两天,业绩不达标了,他又觉得“你看前几天都超标,真好!”这种反复摸跳,让人目标名存实亡,还咋积累经验�? # 无理取闹三:忽略周期规律�? 这种人最喜欢盯着一个数字大呼小叫,今天涨了 1% 啦,明天跌了 \(0.5\%\) 啦,上蹿下跳逼着你深入分析。如下图,业务本身就是有周期变化的呀,如果整体走势没啥大问题,纠结一天能得出啥结果来…�? # 无理取闹四:故意回避变化�? 这种人和上一种是反着的。上一种人神经过敏,这一种人神经大条。如下图 2,非要拖到数据跌得不行了,才意识到问题。说穿了,就是不想直面问题,能耗就耗着�? 
日常数据有波动是很正常的事(图),而且 5%以内波动,做交叉对比都看不出差异要担心的是,在波动中整体走势越来越低(图 2)或者违背趋势的请(�?2�? 以上种种,本质上是业务部门自身缺少数据思维,拍脑袋决策拍习惯了导致的。不过有一个更深入的问题,还在后边�? # 三、深层本�? 问:如果导航只收集一辆车的行车数据,能不能显示出整条路哪里堵,哪里不赌?当然不行!它得把所有车的数据汇总起来,才容易看出问题。这就是做数据的时候“长袖善舞,多钱善贾”的效应�? 做业务监控同理。如果只收集了总销售收入结果,那就只能提供结果监控。如果有对组成销售收入各个渠道,各个客群做数据收集,就能看到是哪个部分出问题;如果对销售转化过程有数据记录,就可以看到哪些节点出了问题。越详细的记录,监控的时候发现问题就更具体�? 同理,影响结果的原因非常多:用户需求、业务行动、外部环境等等。并且,这些原因不见得能直接用某个指�?维度量化,需要打业务标签,做长期记录观察,才能总结出规律�? 比如做个促销,大家都知道业绩会涨。但到底涨多少,和以下因素都有关系:
1、促销力度 2、促销形式 3、目标数�?4、用户响�?5、执行过�? 要把过去做过的活动,打上业务标签,一一对比,才能看出差异(如下图)�? 活动可能仅仅是用户自然消费参与,活动效益没有大盘波动大很正常,做好标签,才好积累经验
| 活动 A | 活动 B | 活动 C | 活动 D | 活动 E | 活动 F | |
| 活动名称 | XXXX | XXXX | XXXX | XXXX | XXXX | XXXX |
| 活动类型 | 用户 | 用户 | 用户 | 商品 | 商品 | 商品 |
| 可参与对�?/td> | 全体 | 新人 | VIP | 商品渗透率 70% | 商品渗透率 40% | 商品渗透率 20% |
| 奖励形式 | 优惠�?/td> | 优惠�?/td> | 积分 | 买赠 | 买赠 | 折扣 |
| 奖励力度 | 10% | 50% | 20% | 30% | 30% | 30% |
| 持续时间 | 10 �?/td> | 全月 | 15 �?/td> | 15 �?/td> | 15 �?/td> | 10 �?/td> |
| 实际参与人数 | 30 �?/td> | 20 �?/td> | 10 �?/td> | 70 �?/td> | 40 �?/td> | 10 �?/td> |
| 实际参与�?/td> | 30% | 30% | 80% | 70% | 40% | 20% |
| 活动自身 GMV | 3000 �?/td> | 2000 �?/td> | 2000 �?/td> | 5000 �?/td> | 2500 �?/td> | 2500 �?/td> |
| 同期�?GMV 波动 | 5% | 2% | 5% | 10% | 5% | 3% |
这种活,只靠一次分析,一天的监控肯定搞不掂。需要长期积累。如果缺少积累,大家只是口头上笼统讨论“为啥上活动了,业绩还不涨?”那肯定讨论不出来个东西�? 很多时候,业务会说:数据有很多,就是没用起来。注意!业务部门经常把数据的条数多,当成“数据很多”。而数据分析口中的“数据很多”指的是过程指标+分类维度很多(如下图)�? 
业务口中的“数据多”,经常是堆了一堆结果指标,可分析的维度过程指标很少
这里的区别是巨大的,过程指标 + 分类维度,才是深入解读的数据的关键�? 有过程指标,才能看到问题发生节点有分类维度,才能做个体对比找差距有业务标签,才能快速抓住重点问�? 光有一个结果指标,数据的可分析程度是很稀薄的,也就看看周期规律,没了�? 当然,还有些场景,是数据分析师自掘坟墓,引火烧身�? # 四、自掘坟墓招 diss
最大的自掘坟墓行为,当然是:闭门造车,不懂业务�? 有的上网到处�?GMV 波动的标准是啥呀有的拿着 1% 波动差异和各种维度交叉试图看大小的还有的一门心思研究指标是不是符合正态分布,2 倍标准差在哪�? 结果这么选出来的”异常�?,不是自然波动,就是业务在上活动。除了引来一�?我早知道�?以外,别无他用�? 
正向事件�?
促销、爆款上架、优质流�? # 负向事件�? 内部:缺货、活动结束、BUG 外部:对手大促销、季节更�? # 中立事件�? 系统改版、流程调整(效果待评估,有可能正、有可能负)
把已发生、预计发生的事件,标记在数据上,能快速形成解读(甚至可以看到这个跌门王……)
五、小�?
业务上的数据异常,指的是实际业绩数据,超过业务的期望值�? 在期望值内的,哪怕数字上波动很大,也不见得引发焦虑。超过期望值的,哪怕数字小,哪怕是上涨,也会引发疑问。没有期望值的,标准反复横跳的,丫当然会天天焦�? 因此,想让监控做得好,需要一个系统工程:
1、量化业务目�?2、按时间/部门拆分目标 3、了解目标指标的周期规律 4、了解业务部门到底干了啥�?、收集过往业务行动效果结合业务行动+趋势变化,解读数据�? 这样才能充分评估形式,做出准确的判断。当然并不是每个公司都有这么好的氛围,甚至经济下行压力之下,有些公司的业务就是喜欢把锅乱甩,所以作为数据分析师,我们做好本分工作,我们自己不要犯四种无理取闹错误,多积累经验即可。换工作的时候,也能充分证明自己的实力。请大家放宽心,学到的本事,始终是自己的�